Phương pháp nghiên cứu Protein

Các hoạt động và chức năng của protein có thể nghiên cứu trong ống nghiệm, (in vitro) in vivo, và in silico. Phương pháp in vitro nghiên cứu các protein được sàng lọc trong những môi trường có kiểm soát giúp tìm hiểu một protein thực hiện chức năng của nó như thế nào: ví dụ, lĩnh vực nghiên cứu động học enzyme (enzyme kinetic) khám phá cơ chế phản ứng của sự hoạt động xúc tác của một enzyme và ái lực của nó đối với nhiều phân tử cơ chất khác nhau. Ngược lại, phương pháp thực nghiệm in vivo cung cấp thông tin về vai trò sinh lý của một protein bên trong tế bào hay thậm chí toàn bộ sinh vật. Phương pháp in silico sử dụng các phương pháp của tin sinh học để nghiên cứu protein.

Tinh sạch protein

Thiết bị sắc ký FPLC dùng trong tinh chế protein

Để thực hiện phân tích in vitro, một protein cần nghiên cứu phải được tinh sạch và sàng lọc (protein purification) khỏi những thành phần khác của tế bào. Quá trình này thường bắt đầu bằng cách phá tế bào (hay tiêu tế bào, cytolysis), khi ấy màng tế bào bị phá vỡ khi lượng nước thẩm thấu quá nhiều vào trong tế bào và các thành phần bên trong được giải phóng vào một dung môi gọi là dung dịch thủy phân tế bào (crude lysate, hay cytolysate). Hỗn hợp thu được được tinh sạch bằng phương pháp siêu ly tâm (ultracentrifugation), mà phân tách nhiều thành phần tế bào thành các phần chứa các protein hòa tan khác nhau; như màng lipid và protein; bào quan tế bào, và axit nucleic. Hỗn hợp được kết tinh bằng phương pháp tách tinh thể muối (salting out) cho phép tập trung protein từ dung dịch này. Sau đó sử dụng nhiều kỹ thuật sắc ký để cô lập một hoặc một vài protein cần nghiên cứu dựa trên những tính chất của chúng như trọng lượng phân tử, tổng điện tích và ái lực liên kết.[45] Mức độ sàng lọc được giám sát nhờ sử dụng nhiều kỹ thuật điện di trên gel (gel electrophoresis) nếu biết trọng lượng phân tử và điểm đẳng điện (isoelectric point) của protein cần nghiên cứu, hoặc bằng phân tích phổ nếu protein có những đặc trưng phổ dễ phân biệt, hoặc bằng thí nghiệm thử enzyme (enzyme assay) nếu protein có hoạt tính enzyme. Thêm vào đó, protein có thể được cô lập theo điện tích của chúng nhờ sử dụng phương pháp tập trung đẳng điện (isoelectric focusing).[46]

Đối với các protein tự nhiên, cần phải thực hiện một chuỗi các bước tinh sạch trước khi có thể thu được một lượng protein đủ thuần khiết cho mục đích sử dụng trong phòng thí nghiệm. Để làm đơn giản quá trình này, các nhà hóa sinh thường sử dụng kỹ thuật di truyền để thêm vào các đặc điểm cho protein giúp dễ dàng sàng lọc chúng hơn mà không làm ảnh hưởng đến cấu trúc hay hoạt động của chúng. Ở đây, một "chất đánh dấu" (tag) chứa một trình tự axit amino đặc hiệu, thường là một chuỗi histidine (chất "His-tag"), được gắn vào một đầu của protein. Kết quả là, khi đưa dung dịch hòa tan protein vào các ống nghiệm của máy sắc ký chứa niken, histidine liên kết phối tử với niken và đọng lại trong cột trong khi những thành phần không được đánh dấu trong dung dịch sẽ chảy qua không bị cản trở. Nhiều phương pháp đánh dấu đã được phát triển để giúp các nhà nghiên cứu sàng lọc các protein đặc biệt từ những hợp chất phức tạp.[47]

Khu trú tế bào

Protein bên trong các ngăn tế bào khác nhau và ở các cấu trúc mà được đánh dấu bằng protein huỳnh quang xanh (ở đây có màu trắng). Thứ tự từ trên, từ trái sang phải: Nhân tế bào (nucleus), hạt nhân tế bào (nucleolus), vỏ nhân tế bào (nuclear envelope), lưới nội chất (ER), bộ máy Golgi, thực bào (lyosomes), màng sinh chất (plasma membrane), tế bào chất (cytoplasm), trung thể (centrosome), ty thể (mitochondria), vi ống (microtubule), actin.

Phương pháp nghiên cứu in vivo cho protein thường đề cập đến sự tổng hợp và sự định vị (khu trú, localization) protein bên trong tế bào. Mặc dù nhiều protein nội bào được sinh tổng hợp bên trong tế bào chất và ở các vị trí liên kết với màng tế bào hoặc protein được tiết ra từ mạng lưới nội chất, chi tiết cụ thể bằng cách nào mà các protein được định hướng (protein targeting) đến những bào quan cụ thể hoặc các cấu trúc của tế bào vẫn chưa được hiểu rõ. Một kỹ thuật hữu ích để đánh giá sự khu trú tế bào bằng cách sử dụng kỹ thuật di truyền nhằm biểu hiện bên trong một tế bào một protein dung hợp (fusion protein, hay chimera, một protein được tạo ra thông qua việc nối hai hoặc nhiều đoạn gen với nhau mà ban đầu mã hóa cho từng protein riêng biệt) chứa protein tự nhiên cần nghiên cứu mà nó liên kết với một "thành phần báo cáo" như protein huỳnh quang xanh (GFP).[48] Vị trí của protein dung hợp bên trong tế bào có thể dễ dàng nhận ra và chụp ảnh dưới kính hiển vi,[49] như minh họa ở hình bên cạnh.

Những phương pháp khác nhằm lý giải vị trí của protein trong tế bào đòi hỏi sử dụng các ngăn nội bào chỉ thị đã biết cho từng vùng chuyên biệt như lưới nội chất ER, bộ máy Golgi, thực bào, không bào, ty thể, lục lạp, màng sinh chất, vv. Bằng cách sử dụng các phân tử đánh dấu huỳnh quang xanh cho những vùng chỉ thị này hoặc của những kháng thể cho những phân tử chỉ thị đã biết, người ta có thể dễ dàng nhận ra vị trí của protein cần nghiên cứu trong tế bào. Ví dụ, kỹ thuật hiển vi huỳnh quang miễn dịch gián tiếp (indirect immunofluorescence) sẽ cho phép huỳnh quang các vị trí và hiển thị chúng. Bột huỳnh quang được sử dụng để đánh dấu các ngăn của tế bào cho các mục đích tương tự.[50]

Có những kỹ thuật khác, ví dụ như kỹ thuật hóa mô miễn dịch (immunohistochemistry) thường lợi dụng một kháng thể của một hay nhiều protein cần nghiên cứu mà liên hợp với các enzyme để thu được hoặc là vị trí phát sáng hoặc là tín hiệu tạo sắc tố (chromogenic) mà các nhà nghiên cứu có thể so sánh giữa các mẫu, cho phép họ thu thập thông tin về vị trí của protein. Một kỹ thuật ứng dụng khác là đồng cất phân đoạn (cofractionation) trong gradien sucrose (hoặc những vật liệu khác) sử dụng các bước lọc ly tâm phân đoạn (differential centrifugation).[51] Trong khi kỹ thuật này không cho biết sự đồng khu trú của một khoang của tỷ trọng đã biết và protein quan tâm, nó tăng tỷ lệ tinh khiết, và tuân theo các nghiên cứu trên quy mô lớn.

Cuối cùng, phương pháp tiêu chuẩn vàng để xác định sự khu trú tế bào là bằng kỹ thuật hiển vi điện tử miễn dịch (immunoelectron microscopy). Kỹ thuật này cũng sử dụng một kháng thể với protein cần nghiên cứu, và kết hợp với các kỹ thuật hiển vi điện tử cổ điển khác. Mẫu được chuẩn bị như đối với kiểm tra qua kính hiển vi điện từ thông thường, và sau đó được xử lý bằng một kháng thể với protein quan tâm mà liên hợp với vật liệu có mật độ electron dày đặc, mà thường là vàng. Kỹ thuật này cho phép xác định được chi tiết siêu cấu trúc cũng những vị trí của protein đang cần nghiên cứu.[52]

Thông qua các ứng dụng kỹ thuật di truyền khác được biết đến như gây đột biến định hướng điểm (site-directed mutagenesis), các nhà nghiên cứu có thể thay đổi được trình tự của protein và do đó đến cấu trúc của nó, sự khu trú tế bào, và tính nhạy cảm đối với sự điều hòa biểu hiện. Kỹ thuật này thậm chí cho phép đính những phân tử axit amino không có trong tự nhiên vào protein, bằng sử dụng các tRNA được sửa đổi,[53] và có thể cho phép đánh giá sự hợp lý trong thiết kế protein mới với những tính chất nổi bật.[54]

Proteomic

Tổng toàn bộ protein ở một thời điểm có trong một tế bào hoặc loại tế bào được gọi là bộ protein hay proteome, và ngành nghiên cứu tập hợp dữ liệu lớn như thế gọi là proteomic, được đặt tên tương tự như của ngành genomic. Các kỹ thuật thực nghiệm quan trọng của proteomic bao gồm điện di trên keo hai chiều (2D gel electrophoresis),[55] cho phép tách số lượng lớn các protein, phương pháp khối phổ,[56] cho phép nhanh chóng nhận ra loại protein và trình tự các peptide (hầu hết sau khi tiêu hóa trên gel (in-gel digestion)), protein microarray,[57] cho phép xác định mức độ tương đối của một số lớn các protein có mặt trong một tế bào, và sàng lọc thể lai hai mảnh (two-hybrid screening), cho phép khám phá một cách có hệ thống tương tác protein-protein.[58] Tổng toàn bộ các tương tác sinh học khả dĩ như những tương tác này gọi là interactome.[59] Nỗ lực có hệ thống nhằm xác định cấu trúc của protein biểu diễn cho mỗi hình dạng gập khả dĩ gọi là ngành nghiên cứu bộ gene cấu trúc (structural genomics).[60]

Tin sinh học

Bài chi tiết: Tin sinh học

Rất nhiều phương pháp tính toán đã được phát triển để phân tích cấu trúc, chức năng, và sự tiến hóa của protein.

Nhờ sự phát triển của những công cụ này giúp đem lại lượng lớn dữ liệu thu thập được về bộ gene và bộ protein (proteomic) ở nhiều sinh vật, bao gồm bộ gene người. Không thể đơn giản chỉ nghiên cứu bằng thực nghiệm mọi protein được, do vậy chỉ có một vài phân tử được nghiên cứu trong phòng thí nghiệm trong khi các công cụ tính toán được sử dụng để ngoại suy ra những protein tương tự. Những protein tương đồng này có thể nhận ra với độ chính xác cao ở những sinh vật có liên hệ xa bởi phương pháp bắt cặp trình tự (sequence alignment). Bộ gene và trình tự gene được tìm kiếm bằng nhiều công cụ khác nhau cho những tính chất nhất định. Các công cụ nhận diện trình tự (sequence profiling tools) có khả năng tìm ra những vị trí enzyme giới hạn, khung đọc mở (open reading frame) ở trình tự nucleotide, và dự đoán cấu trúc bậc 2. Cây phát sinh chủng loài có thể xây dựng và các giả thuyết tiến hóa được phát triển nhờ sử dụng các phần mềm chuyên dụng như ClustalW khi xem xét tổ tiên của những sinh vật hiện đại và các gene mà chúng biểu hiện. Lĩnh vực tin sinh học hiện nay trở thành công cụ quý giá cho phân tích gene và protein.

Dự đoán cấu trúc và mô phỏng

Các axit amin có thể được phân tích để dự đoán cấu trúc bậc 2, bậc 3 và cấu trúc protein bậc 4, trong trường hợp này hemoglobin chứa các nhóm heme.

Bổ sung cho ngành bộ gen cấu trúc (structural genomic), lĩnh vực dự đoán cấu trúc protein phát triển các mô hình toán học hữu hiệu về protein để dự đoán lý thuyết dựa trên công cụ tính toán về cấu trúc của chúng, thay vì phát hiện cấu trúc protein trong phòng thí nghiệm.[61] Phương pháp dự đoán cấu trúc thành công nhất, gọi là mô hình đồng đẳng (homology modeling), dựa trên sự tồn tại của một cấu trúc "khuôn mẫu" với trình tự giống với của protein đang được xây dựng mô hình; mục đích của bộ gen cấu trúc là cung cấp hình ảnh biểu diễn thỏa đáng trong các cấu trúc đã biết để mô hình hóa nhiều nhất có thể các cấu trúc còn chưa được biết.[62] Mặc dù mục tiêu tạo ra những mô hình chính xác vẫn còn là thử thách khi chỉ những khuôn mẫu có liên hệ xa là mới có, người ta đã đề xuất rằng sự bắt cặp trình tự là nút thắt cổ chai trong quá trình này, khi có thể tạo ra những mô hình khá chính xác nếu đã biết một trình tự bắt cặp "hoàn hảo".[63] Nhiều phương pháp dự đoán cấu trúc được ứng dụng trong lĩnh vực kỹ thuật protein, trong đó những protein gập lạ đã được thiết kế.[64] Một vấn đề tính toán phức tạp hợp đó là dự đoán tương tác liên phân tử, như trong sự cập bến của phân tử (molecular docking) và dự đoán tương tác protein–protein.[65]

Những mô hình toán học để mô phỏng tiến trình động lực của sự gập protein và liên kết protein bao gồm cơ học phân tử, và đặc biệt là động lực học phân tử. Kỹ thuật Monte Carlo trang bị cho các tính toán, mà dựa trên điện toán phân tán và tính toán song song tiên tiến (ví dụ như dự án Folding@home[66] thực hiện mô phỏng cấu trúc phân tử dựa trên GPU). Mô phỏng in silico khám phá ra sự gập của những miền nhỏ xoắn α trên protein như đầu của villin[67] và protein phụ cho HIV.[68] Các phương pháp lai kết hợp chuẩn động lực học phân tử với toán học của cơ học lượng tử để khám phá các trạng thái điện tử của rhodopsin.[69]

Dự đoán protein mất trật tự và cấu trúc không cố định

Nhiều protein (ở sinh vật nhân thực Eucaryota ~33%) chứa nhiều đoạn với cấu trúc không ổn định nhưng có chức năng sinh học và được phân loại thành protein mất trật tự nội tại (intrinsically disordered proteins).[70]Dự đoán và phân tích protein mất trật tự do đó là một mảng quan trọng của nghiên cứu cấu trúc protein.[71]

Tài liệu tham khảo

WikiPedia: Protein http://www.britannica.com/EBchecked/topic/479680 http://linkinghub.elsevier.com/retrieve/pii/S0006-... http://linkinghub.elsevier.com/retrieve/pii/S1046-... http://www.encyclopedia.com/science/dictionaries-t... http://genomebiology.com/2004/5/4/215 http://www.nature.com/doifinder/10.1038/nature1222... http://onlinelibrary.wiley.com/doi/10.1002/bies.20... http://harvester.fzk.de/ http://adsabs.harvard.edu/abs/1951Natur.168..244H http://adsabs.harvard.edu/abs/1951PNAS...37..235P